Deskriptive Statistik
> Wirtschaftsstatistik
14.90 EUR
Zeitreihen und Prognosen
Text zum Video
Zeitreihen und Prognosen.
Sammeln wir die Daten unseres Restaurants über einen längeren Zeitraum, so entsteht eine Zeitreihe, mit deren Hilfe wir Prognosen für die Zukunft machen können. Im Restaurant haben wir die Umsatzzahlen der letzten 3 Jahre quartalsweise gesammelt so sehen sie aus.
Wie wir aus diesen Daten einen Durchschnitt bilden würden, haben wir bereits gelernt. Wir wollen an dieser Stelle einen neuen Begriff lernen, den des "gleitenden Durchschnitts". Wollen wir den Gleitenden Durchschnitt für das dritte Quartal 2005 bilden, so nehmen wir beispielsweise alle vier Werte aus 2005 plus dem ersten Wert aus 2006, addieren diese fünf Werte und teilen sie durch 5. Heraus kommt folgender Durchschnittswert unseres Restaurantumsatzes in Tausend Euro.
Die Tatsache, dass wir fünf Werte gewählt haben und durch 5 geteilt haben besagt, dass wir den "Durchschnitt fünfter Ordnung für das 3. Quartal 2005" berechnet haben, so steht es auch tiefgestellt hinter dem "y". Ebenso könnten wir den Durchschnitt vierter Ordnung oder "q"-ter Ordnung berechnen.
Nehmen wir die letzten 4 Werte, also das gesamte Jahr 2006, so ergäbe sich dieser Wert.
Wir haben also aus vier Werten für das Jahr 2006 einen gemacht und haben die Werte hierdurch "geglättet".
Auf diese Weise werden übrigens auch gleitende Durchschnitte in Aktien-Charts berechnet.
Wie können wir aus den berechneten Werten auf unsere zukünftigen Restaurantumsätze schließen? Man könnte meinen, dass der berechnete durchschnittliche Umsatz auch in den nächsten Jahren Gültigkeit besitzt. Wenn wir uns die Umsatzzahlen jedoch genauer anschauen, erkennen wir, dass sie von Jahr zu Jahr etwas ansteigen. Ein Durchschnitt aus den Vergangenheitswerten würde dann zu niedrige Werte prognostizieren. Wie können wir unserer Annahme mehr Sicherheit verleihen? In dem wir ein Diagramm der Daten erstellen.
Es ergibt sich folgende Kurve, die ein interessantes Muster zeigt. Wir erkennen einen leicht steigenden Trend über alle Jahre und zusätzlich eine saisonale Komponente. Im Winter hatte unser Restaurant nämlich regelmäßig einen niedrigeren Umsatz, als im Sommer. Unser Ziel war es doch, eine Prognose zu machen.
Hast du eine Idee, wie man den Restaurantumsatz für das erste Quartal 2007 berechnen könnte? Erinnere dich an das letzte Kapitel. Wir hatten aus den Mittel- und Streuungswerten der Daten eine Regressionsgerade berechnet und sie durch die Punkte im Diagramm hindurchgelegt. Auf diese Weise konnten wir die Variable "y" durch die Variable "x" erklären. In diesem Fall würden wir "y", den Umsatz durch die Variable "x", die Zeit erklären. Die erklärende Variable, also "x" werden wir in diesem Beispiel einfach "t" nennen, da man in der Statistik für Zeitangaben gerne ein "t" verwendet.
Wir berechnen jetzt also eine Regressionsgerade für unser Diagramm - genau so, wie du es schon kennst. Wir ermitteln im Schnelldurchgang alle benötigten Werte aus unseren Umsatzdaten, setzen daraus, wie gewohnt die Regressionskoeffizienten zusammen, und stellen die Gleichung unserer Regressionsgeraden auf.
Zeichnen wir die Regressionsgerade ins Diagramm ein, ergibt sich diese Linie, auf der alle zukünftigen Restaurantumsätze zu finden sein sollten.
Fällt dir aber auf, dass sich für Sommer- und Wintersaison regelmäßig Abweichungen ergeben? Wir können mit unserer Regressionsgeraden also nur die "langfristige" Trendkomponente prognostizieren und haben einen wichtigen Einflussfaktor auf den Restaurantumsatz, nämlich die Saisonkomponente außer Acht gelassen. Wir werden die Berücksichtigung der Saisonkomponente im Folgenden nachholen, um am Ende eine gute Prognose machen zu können. Nicht umsonst sehen wir hier noch einmal die Zeitreihe unserer Restaurantumsätze. Um die "Saisonkomponente" ermitteln zu können, müssen wir die Zeitreihe nämlich "trendbereinigen".
Führen wir dazu zunächst die Zeile "t" ein, in der einfach die aufsteigenden Zeitwerte stehen. Setzen wir nun alle 12 "t"-Werte nacheinander in unsere zuvor aufgestellte Regressionsgleichung ein, ergeben sich daraus diese so genannten "Trendwerte".
Im Diagramm liegen all diese Werte genau auf der Regressionsgeraden. Jetzt ist es einfach, die Saisonkomponente zu erkennen.
Sie ist die Differenz zwischen den Trendwerten, also den Werten auf der Regressionsgeraden und den realen Umsätzen.
Wonach haben wir die ganze Zeit gesucht? Nach einer guten Prognose für das erste Quartal 2007 und diese können wir jetzt machen. Wir berechnen die Trendkomponente für das erste Quartal 2007, also für "t gleich 13", woraus sich dieser Trendwert ergibt.
In die Berechnung der Saisonkomponente werden wir die ersten Quartale der drei Jahre vorhergehenden Jahre einbeziehen. Was kann man aus den letzten Jahren schließen? Die Saisonkomponente war im ersten Quartal immer negativ, wir müssen unseren prognostizierten und eben berechneten Trendwert also etwas verringern.
Die Saisonkomponente für das erste Quartal 2007 ergibt sich durch Mittelung der Saisonkomponenten aus den vorhergehenden ersten Quartalen und es ergibt sich dieser Wert.
Wenn wir Trend- und Saisonkomponente jetzt zusammensetzen, ergibt sich "unser prognostizierter Restaurantumsatz für das erste Quartal 2007".
Generell sieht das Modell so aus und man addiert korrekter Weise noch eine Restkomponente für die restlichen, nicht durch Trend und Saison erklärbaren Abweichungen des Umsatzes.
Merke dir Folgendes: Aus Zeitreihen kann man "Durchschnitte", Trends und Saisonkomponenten bilden. Die Trendkomponente erhält man durch Aufstellung einer Regressionsgleichung und die Saisonkomponente ergibt sich aus den Abweichungen der Vorsaisons. Abschließend sei angemerkt, dass man aus Zeitreihen noch realistischere Prognose erhält, wenn man aufwendigere Methoden anwendet. Eine davon ist z.B. die "multiple Regression", die anstatt zu einer linearen Regressionsgeraden zu komplexen Gleichungen und Kurven führt, wodurch die Schwankungen der Zeitreihe meistens noch besser abgebildet werden können.
An dieser Stelle werden wir hierauf aber nicht weiter eingehen.
Sammeln wir die Daten unseres Restaurants über einen längeren Zeitraum, so entsteht eine Zeitreihe, mit deren Hilfe wir Prognosen für die Zukunft machen können. Im Restaurant haben wir die Umsatzzahlen der letzten 3 Jahre quartalsweise gesammelt so sehen sie aus.
Wie wir aus diesen Daten einen Durchschnitt bilden würden, haben wir bereits gelernt. Wir wollen an dieser Stelle einen neuen Begriff lernen, den des "gleitenden Durchschnitts". Wollen wir den Gleitenden Durchschnitt für das dritte Quartal 2005 bilden, so nehmen wir beispielsweise alle vier Werte aus 2005 plus dem ersten Wert aus 2006, addieren diese fünf Werte und teilen sie durch 5. Heraus kommt folgender Durchschnittswert unseres Restaurantumsatzes in Tausend Euro.
Die Tatsache, dass wir fünf Werte gewählt haben und durch 5 geteilt haben besagt, dass wir den "Durchschnitt fünfter Ordnung für das 3. Quartal 2005" berechnet haben, so steht es auch tiefgestellt hinter dem "y". Ebenso könnten wir den Durchschnitt vierter Ordnung oder "q"-ter Ordnung berechnen.
Nehmen wir die letzten 4 Werte, also das gesamte Jahr 2006, so ergäbe sich dieser Wert.
Wir haben also aus vier Werten für das Jahr 2006 einen gemacht und haben die Werte hierdurch "geglättet".
Auf diese Weise werden übrigens auch gleitende Durchschnitte in Aktien-Charts berechnet.
Wie können wir aus den berechneten Werten auf unsere zukünftigen Restaurantumsätze schließen? Man könnte meinen, dass der berechnete durchschnittliche Umsatz auch in den nächsten Jahren Gültigkeit besitzt. Wenn wir uns die Umsatzzahlen jedoch genauer anschauen, erkennen wir, dass sie von Jahr zu Jahr etwas ansteigen. Ein Durchschnitt aus den Vergangenheitswerten würde dann zu niedrige Werte prognostizieren. Wie können wir unserer Annahme mehr Sicherheit verleihen? In dem wir ein Diagramm der Daten erstellen.
Es ergibt sich folgende Kurve, die ein interessantes Muster zeigt. Wir erkennen einen leicht steigenden Trend über alle Jahre und zusätzlich eine saisonale Komponente. Im Winter hatte unser Restaurant nämlich regelmäßig einen niedrigeren Umsatz, als im Sommer. Unser Ziel war es doch, eine Prognose zu machen.
Hast du eine Idee, wie man den Restaurantumsatz für das erste Quartal 2007 berechnen könnte? Erinnere dich an das letzte Kapitel. Wir hatten aus den Mittel- und Streuungswerten der Daten eine Regressionsgerade berechnet und sie durch die Punkte im Diagramm hindurchgelegt. Auf diese Weise konnten wir die Variable "y" durch die Variable "x" erklären. In diesem Fall würden wir "y", den Umsatz durch die Variable "x", die Zeit erklären. Die erklärende Variable, also "x" werden wir in diesem Beispiel einfach "t" nennen, da man in der Statistik für Zeitangaben gerne ein "t" verwendet.
Wir berechnen jetzt also eine Regressionsgerade für unser Diagramm - genau so, wie du es schon kennst. Wir ermitteln im Schnelldurchgang alle benötigten Werte aus unseren Umsatzdaten, setzen daraus, wie gewohnt die Regressionskoeffizienten zusammen, und stellen die Gleichung unserer Regressionsgeraden auf.
Zeichnen wir die Regressionsgerade ins Diagramm ein, ergibt sich diese Linie, auf der alle zukünftigen Restaurantumsätze zu finden sein sollten.
Fällt dir aber auf, dass sich für Sommer- und Wintersaison regelmäßig Abweichungen ergeben? Wir können mit unserer Regressionsgeraden also nur die "langfristige" Trendkomponente prognostizieren und haben einen wichtigen Einflussfaktor auf den Restaurantumsatz, nämlich die Saisonkomponente außer Acht gelassen. Wir werden die Berücksichtigung der Saisonkomponente im Folgenden nachholen, um am Ende eine gute Prognose machen zu können. Nicht umsonst sehen wir hier noch einmal die Zeitreihe unserer Restaurantumsätze. Um die "Saisonkomponente" ermitteln zu können, müssen wir die Zeitreihe nämlich "trendbereinigen".
Führen wir dazu zunächst die Zeile "t" ein, in der einfach die aufsteigenden Zeitwerte stehen. Setzen wir nun alle 12 "t"-Werte nacheinander in unsere zuvor aufgestellte Regressionsgleichung ein, ergeben sich daraus diese so genannten "Trendwerte".
Im Diagramm liegen all diese Werte genau auf der Regressionsgeraden. Jetzt ist es einfach, die Saisonkomponente zu erkennen.
Sie ist die Differenz zwischen den Trendwerten, also den Werten auf der Regressionsgeraden und den realen Umsätzen.
Wonach haben wir die ganze Zeit gesucht? Nach einer guten Prognose für das erste Quartal 2007 und diese können wir jetzt machen. Wir berechnen die Trendkomponente für das erste Quartal 2007, also für "t gleich 13", woraus sich dieser Trendwert ergibt.
In die Berechnung der Saisonkomponente werden wir die ersten Quartale der drei Jahre vorhergehenden Jahre einbeziehen. Was kann man aus den letzten Jahren schließen? Die Saisonkomponente war im ersten Quartal immer negativ, wir müssen unseren prognostizierten und eben berechneten Trendwert also etwas verringern.
Die Saisonkomponente für das erste Quartal 2007 ergibt sich durch Mittelung der Saisonkomponenten aus den vorhergehenden ersten Quartalen und es ergibt sich dieser Wert.
Wenn wir Trend- und Saisonkomponente jetzt zusammensetzen, ergibt sich "unser prognostizierter Restaurantumsatz für das erste Quartal 2007".
Generell sieht das Modell so aus und man addiert korrekter Weise noch eine Restkomponente für die restlichen, nicht durch Trend und Saison erklärbaren Abweichungen des Umsatzes.
Merke dir Folgendes: Aus Zeitreihen kann man "Durchschnitte", Trends und Saisonkomponenten bilden. Die Trendkomponente erhält man durch Aufstellung einer Regressionsgleichung und die Saisonkomponente ergibt sich aus den Abweichungen der Vorsaisons. Abschließend sei angemerkt, dass man aus Zeitreihen noch realistischere Prognose erhält, wenn man aufwendigere Methoden anwendet. Eine davon ist z.B. die "multiple Regression", die anstatt zu einer linearen Regressionsgeraden zu komplexen Gleichungen und Kurven führt, wodurch die Schwankungen der Zeitreihe meistens noch besser abgebildet werden können.
An dieser Stelle werden wir hierauf aber nicht weiter eingehen.
Inhalt
Einführung
Häufigkeitstabellen u. Diagramme
statistische Daten
Ãœbung 1
qualitative Merkmale
Ãœbung 2
quantitative diskrete Merkmale
Ãœbung 3
quantitative stetige Merkmale
Ãœbung 4
Lagemaße
arithmetisches Mittel
Ãœbung 5
Modus und Median
Ãœbung 6
Verteilungslage
Ãœbung 7
Harmonisches und geometrisches Mittel
Ãœbung 8
Streuungsmaße
Spannweite
Varianz und Standardabweichung
Ãœbung 9
Streuungszerlegungssatz
Ãœbung 10
Korrelation u. Regressionsanalyse
Streuungsdiagramm
Ãœbung 11
Korrelationsmaße
Ãœbung 12
Bestimmtheitsmaß u. DW-Koeffizient
Ãœbung 13
Wirtschaftsstatistik
Zeitreihen und Prognosen
Ãœbung 14
Indizes
Ãœbung 15
Konzentrationskurven u. Indizes
Ãœbung 16
Lorenzkurve u. Gini-Koeffizient
Ãœbung 17
Statistik am Computer
Excel
SPSS
Statistiklabor
Häufigkeitstabellen u. Diagramme
statistische Daten
Ãœbung 1
qualitative Merkmale
Ãœbung 2
quantitative diskrete Merkmale
Ãœbung 3
quantitative stetige Merkmale
Ãœbung 4
Lagemaße
arithmetisches Mittel
Ãœbung 5
Modus und Median
Ãœbung 6
Verteilungslage
Ãœbung 7
Harmonisches und geometrisches Mittel
Ãœbung 8
Streuungsmaße
Spannweite
Varianz und Standardabweichung
Ãœbung 9
Streuungszerlegungssatz
Ãœbung 10
Korrelation u. Regressionsanalyse
Streuungsdiagramm
Ãœbung 11
Korrelationsmaße
Ãœbung 12
Bestimmtheitsmaß u. DW-Koeffizient
Ãœbung 13
Wirtschaftsstatistik
Zeitreihen und Prognosen
Ãœbung 14
Indizes
Ãœbung 15
Konzentrationskurven u. Indizes
Ãœbung 16
Lorenzkurve u. Gini-Koeffizient
Ãœbung 17
Statistik am Computer
Excel
SPSS
Statistiklabor